iT邦幫忙

2023 iThome 鐵人賽

DAY 20
0
自我挑戰組

我與熊貓Pandas相處的日子系列 第 20

Day20- 資料分析(3)年度精選

  • 分享至 

  • xImage
  •  

當我們在眾多資料中,想挑出各年度中的佼佼者時可使用此方法。

匯入資料

   電影名稱 年份  分數
0   A電影  2019  54
1   B電影  2018  90
2   C電影  2018  58
3   D電影  2022  53
4   E電影  2019  66
5   F電影  2021  82
6   G電影  2023  85
7   H電影  2020  75
8   I電影  2023  56
9   J電影  2020  55
10  K電影  2018  48

目標:從資料中挑選出年度精選電影
使用sort_values(),將上述資料以年份從大到小排序。

movie.sort_values('年份',ascending=False)

執行結果:
	電影名稱	年份	分數
6	G電影	2023	85
8	I電影	2023	56
3	D電影	2022	53
5	F電影	2021	82
7	H電影	2020	75
9	J電影	2020	55
0	A電影	2019	54
4	E電影	2019	66
1	B電影	2018	90
2	C電影	2018	58
10	K電影	2018	48

在sort_values()中加入另一個欄位名稱,會將上述資料以年份從大到小排序。
會先根據年份欄位從大到小排序,若遇相同年份者,則會依分數欄位從大到小進行排序。

movie.sort_values(['年份','分數'],ascending=False)

執行結果:
	電影名稱	年份	分數
6	G電影	2023	85
8	I電影	2023	56
3	D電影	2022	53
5	F電影	2021	82
7	H電影	2020	75
9	J電影	2020	55
4	E電影	2019	66
0	A電影	2019	54
1	B電影	2018	90
2	C電影	2018	58
10	K電影	2018	48

使用drop_duplicates(),刪除年份欄位重覆出現的資料,只會保留第一筆資料。

movie.sort_values(['年份','分數'],ascending=False).drop_duplicates(subset='年份')

執行結果:
電影名稱	年份	分數
6	G電影	2023	85
3	D電影	2022	53
5	F電影	2021	82
7	H電影	2020	75
4	E電影	2019	66
1	B電影	2018	90

傳回後即為每個年度評分最高的電影排行榜就出爐囉~ /images/emoticon/emoticon50.gif


上一篇
Day19- 資料分析(2)電影排名
下一篇
Day21- 資料分析(4)樞紐分析
系列文
我與熊貓Pandas相處的日子30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言